期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于语义相似度的论坛话题追踪方法
席耀一 林琛 李弼程 周杰 许旭阳
计算机应用    2011, 31 (01): 93-96.  
摘要1811)      PDF (639KB)(1289)    收藏
现有的话题追踪方法大多面向新闻数据,将其应用于论坛时效果不够理想。结合论坛的特点,提出一种基于语义相似度的论坛话题追踪方法。该方法首先通过构建话题和帖子的关键词表建立其文本表示模型,然后利用知网计算两个关键词表的语义相似度并以此作为帖子与话题的相关程度,最后根据相关程度实现论坛话题追踪。该方法较好地避免了向量空间模型的缺陷。实验表明,该方法能比较有效地解决面向论坛的话题追踪问题。
相关文章 | 多维度评价
2. 基于机器学习的网络新闻评论情感分类研究
周杰 林琛 李弼程
计算机应用    2010, 30 (4): 1011-1014.  
摘要1412)      PDF (847KB)(2098)    收藏
首先对网络新闻评论数据的特点进行归纳总结,选取不同的特征集、特征维度、权重计算方法和词性等因素进行分类测试,并对实验结果进行分析比较。对比结果表明:情感词和论据词语搭配效果优于仅使用情感词作为评论特征;另外该类数据中特征维度对分类准确率的影响减小,且TF-IDF权重计算方法仍优于布尔型权重;在词性选择上,名词和动词词性比形容词和副词取得更好的分类效果。
相关文章 | 多维度评价
3. 基于BIC的新闻视频近似重复帧检测方法
白志杰 李弼程 彭天强
计算机应用    2009, 29 (06): 1694-1701.  
摘要1066)      PDF (473KB)(1063)    收藏
近似重复帧检测是新闻视频检索和追踪的重要组成部分。简要介绍了近似重复帧的定义,给出了所使用的角点检测方法及优点,提出了使用BIC对两个帧的特征值序列进行判决来确定是否近似重复的方案。实验结果表明,该方法在不需要设定阈值和机器学习的同时,召回率和准确率都有很好的表现。
相关文章 | 多维度评价
4. 基于正反例训练的SVM命名实体关系抽取
刘路 李弼程 张先飞
计算机应用   
摘要1714)      PDF (632KB)(1061)    收藏
根据中文命名实体关系抽取的特点,从中文的形态学、语法及语义等几个方面选取特征并构建特征向量,然后将符合特定实体关系模板的候选命名实体对抽取出来并分为正反例。利用正反例样本对支持向量机(SVM)抽取器进行训练,以此来判断候选命名实体对的关系类型。实验证明,本方法能够有效提高中文命名实体关系抽取的准确率。
相关文章 | 多维度评价
5. 低速率信道环境下鲁棒的说话人确认
石如亮 王波 李弼程 高新建
计算机应用   
摘要1692)      PDF (584KB)(784)    收藏
研究了多种低速率信道环境下,语音编码对与文本无关说话人确认的影响。针对训练和测试语音匹配和不匹配的两种情况下,分别提出了两种方法来提高系统的鲁棒性。在前者中,通过分析语音编码对LPCC参数的影响,提出了一种基于编码失真的 LPCC 加权参数。在后者中,采用了基于高斯混合模型(GMM)的语音编码检测器,通过判别测试语音的编码类型,选择不同的说话人确认模型。实验结果表明,这两种方法提高了说话人确认系统在多信道条件下的鲁棒性。
相关文章 | 多维度评价
6. 说话人确认中分数归一化的一种新方法
高新建 屈丹 李弼程
计算机应用   
摘要1618)      PDF (529KB)(1015)    收藏
在说话人确认中,由于目标说话人和冒认者的得分分布是双峰分布,并且不同目标说话人模型得分分布不一致,使对所有说话人确定一个统一的阈值变得困难,导致系统性能下降。分数归一化通过调整冒认者的得分分布来调整阈值。简要介绍了目前最常用的两种归一化方法:零归一化(Z-Norm)和测试归一化(T-Norm)。重点引入了一种新的根据KL距离的D-Norm 归一化方法。然后结合Z-Norm 和D-Norm的优点,又提出一种新的方法ZD-Norm。对这四种归一化方法的性能进行了比较。实验表明,ZD-Norm相对Z-Norm和D-Norm,能够更有效地提高说话人确认系统的性能。
相关文章 | 多维度评价
7. 一种有效的垃圾邮件过滤新方法
林琛 李弼程
计算机应用   
摘要1623)      PDF (587KB)(908)    收藏
受到信息粒度原理的启发,给出了一种有效的垃圾邮件过滤新方法。该方法训练过程是将训练样本集合中合法邮件类和垃圾邮件类拆分成四个小类,得到四个小类的类中心向量,从粒度原理角度来看,就是采用更细的粒度来描述训练样本的先验知识。过滤过程则将新进来的邮件分别与四个小类的类中心向量进行相似度比较,最终来判定所属类别。在公共垃圾邮件语料库上测试新方法,同时与目前过滤性能较高的KNN方法进行比较,结果显示新方法具有过滤精度高,过滤速度快等优点。
相关文章 | 多维度评价